「はじめてのdbt活用~DWH内のデータ整備が楽になる!~」を2022年5月30日に再演しました #dbt
さがらです。
2022年5月30日に、はじめてのdbt活用~DWH内のデータ整備が楽になる!~といったタイトルでウェビナーを開催しました。
こちらは、2022年3月10日に開催した内容の再演でした。
そのため、ウェビナーの詳細と3月開催時の質疑応答の内容は下記の記事を御覧ください。
本記事では、5月30日開催時の質疑応答の内容についてまとめます。
質疑応答
以下、ウェビナー中に口頭で回答した内容も含め、全ての質問への回答を記載しておりますので、御覧ください。
1.作成したmaterialized viewをdbtを使用してrefreshすることは可能ですか?
dbtを使用してREFRESHすることは基本的には不可能です。BigQueryやSnowflakeなどのDWHではmaterialized viewは自動更新が基本だと思いますので、その自動更新の仕様に沿うのがよいと思います。
一方で、RedshiftなどREFRESH
コマンド使ってmaterialized viewを手動更新したいケースもあると思います。こちらについて、記述したSELECT文の実行前後に指定したクエリを実行できるhookの機能を使うと、手動更新もできるかもしれません。(こちら検証できておらず恐縮ですが…)
2.documentationで作成したデータカタログのみをデータアナリストなど分析者に向けて公開することは可能でしょうか?
dbt Cloudであれば、Read Only userとしてユーザー招待すればドキュメントだけを公開可能です。
Read Only userが出来ることは下記の記事にもまとめておりますので、参考になると幸いです。
3.airflowなど外部からdbt cloudのdbtコマンドを実行することはできますか?
はい、dbt Cloud専用のOperatorが用意されています。こちらを使用すれば、Airflowを介して、dbt Cloud上でのdbtコマンドを実行可能です。
最後に
dbtに関しては、6月9日にもウェビナーを予定しています!こちらは、dbtだけでなく、FivetranやSnowflakeなど弊社で取り扱いのある他製品とdbtを組み合わせるとどういったことができるのか、という内容を中心にお話します。
ぜひ、こちらにも参加頂けると嬉しいです。